inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[예시문제 작업형2] EDA 중 이상치 처리

해결된 질문

422

가보자고

작성한 질문수 9

0

안녕하세요.

강의 잘 듣고 있습니다.

예시문제 작업형2 풀면서

X_train.describe() 기초통계량 볼 때(3:56)

총 구매액, 최대 구매액의 최소값이 음수여서...

이상치로 판단하고 금액이 <0인 행은 drop..처리하고 했는데 괜찮은 걸까요?

괜찮다면 결측치처리를 X_train, y_train 동시에 해주는 것처럼 결측치도 두 데이터에 모두 해줘야하는거죠?

캡처.PNG

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

1

퇴근후딴짓

  1. test데이터에도 음수인 값이 있는지 확인이 필요해요! 만약 있다면 해당 도메인에서 이런 데이터가 나오는 이유가 있을 수도 있기에 제거는 살짝 고민을 해봐야 합니다.

  2. 제가 추천하는 방식은 최소한의 전처리로 베이스라인(기초) 모델을 만들고 평가 점수를 기록한 다음
    이상치 처리 등의 전처리 후 결과를 비교하는 것이 좋습니다. 모든 전처리의 기준을 베이스라인을 기준과 비교하는 방식을 추천해요!

 

0

가보자고

감사합니다!

로지스틱회귀, 회귀

0

28

2

회귀 문제를 풀때 질문입니다.

0

32

1

불균형 처리 후 성능이 더 낮아졌다면,

0

44

2

실기 체험 제2유형 에러 문의

0

35

1

LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요

0

35

2

3번문제 등분산 가정

0

35

2

작업형3 target 형 변환 질문

0

29

2

[작업형1] 연습문제 섹션1 ~ 10 의 section4

0

23

3

원핫인코딩과 레이블 인코딩에서 concat

0

44

2

제2유형 질문입니다.

0

39

2

C()

0

36

2

작업형 2에서 strafity 적용 유무

0

43

2

수강 기간 연장 가능 여부 문의드립니다.

0

46

1

ols

0

36

2

2유형 작성관련 질문(일반 심화)

0

30

2

2유형 작성관련 질문

0

29

2

2유형 object컬럼 개수 다르면

0

37

2

코딩팡질문이요ㅠㅠ

0

36

2

관찰값과 기대값의 개념이 헷갈립니다.

0

19

2

작업형2 ID 컬럼 삭제 질문

0

39

2

2유형 작성관련 질문

0

27

2

memoryerror 질문

0

21

2

작업형 유형2 이렇게 고정 템플릿으로 가져가도 될까요?

0

37

1

ID 삭제 필수 인가요?

0

33

3